m2sv: Benchmark escalable para razonamiento espacial mapa-vista callejera Descubre m2sv, el nuevo benchmark que evalúa la capacidad de los VLMs para alinear mapas con vistas callejeras. Resultados sorprendentes y desafíos clave. 2026-06-17 · 2 min